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摘要 : Apidermin ( APD) 和 蛋白 家 族 是 一 个 新 的 昆虫 结构 性 表皮 和 蛋白 家 族 。 本 研究 结合 生物 信息 学 和 RT-PCR 扩 增 , 对 
意大利 蜜蜂 Apis mellifera ligustica( 简称 “ 意 蜂 ”) 的 apd-1-like, apd-3-like 和 中 华 蜜蜂 Apis cerena cerena( 简称 "中 蜂 ”) 
的 apd-2 等 3 个 新 的 apd 基因 的 结构 特征 和 表达 进行 了 分 析 , 并 分 析 了 昆虫 APD 和 蛋白 家 族 的 序列 特征 。 结 果 显 示 ， 
在 西方 蜜蜂 Apis mellifera( 简称 “ 西 蜂 ” ) 中, apd 基因 家 族 的 6 个 成 员 串 联 排列 在 基因 组 序列 第 4 号 连锁 群 上 , 它们 在 
A. m. ligustica 雄 蜂 头 部 中 的 转录 水 平 差异 明显 , 且 其 局 动 子 序列 所 含 顺 式 元 件 也 不 同 。 中 蜂 apd-2 和 意 蜂 apd-1 -like 
都 含有 3 个 外 显 子 和 2 个 内 含 子 , 而 意 蜂 apd-3-like 则 由 4 个 外 显 子 和 3 个 内 含 子 组 成 。 重 日 序列 分 析 结 采 显 示 , H 
前 已 知 的 10 条 APD 和 蛋白 序列 N 末端 均 具有 相似 的 信号 肽 序列 , 其 成 熟 和 蛋白 分 子 量 为 6.0 ~37.0 kD, pI 为 6.2~ 
10.8。 其 中 西 蜂 的 APD 1 -3、APD-like 和 东方 蜜蜂 Apis cerena 的 APD-2 等 5 条 较 短 的 多 肽 中 朴 水 氨基 酸 残 基 达 $2% ~ 
67% , H Ala 含量 最 为 丰富 ( 占 25% ~34% ) ; 而 丽 量 晴 集 金 小 蜂 Nasonia vitripennis 的 APD 1 -3 和 西峰 APD-1-like， 
APD-3-like 等 另外 5 条 APD 多 肽 宣 含 Gly(21% ~30% ) ， 其 序列 中 下 水 氮 基 酸 残 基 含量 为 33% ~41% 。 多 肽 序列 多 
重 比 对 和 系统 进化 分 析 结 果 显 示 ，APD 家 族 可 划分 为 2 个 亚 家 族 。 亚 家 族 1 含有 西 蜂 APD 1 -3 和 东方 蜜蜂 APD-2 
等 4 条 较 短 的 多 肽 序列 , 其 N 末端 为 一 个 长 33 aa 的 保守 基 序 ; 亚 家 族 开 由 另外 6 条 相对 较 长 的 多 肽 序列 组 成 , H N 
末端 保守 基 序 长 50 aa, C 末端 保守 基 序 长 16 aa。 本 文 所 描述 的 APD 和 蛋白 家 族 序 列 特征 有 助 于 以 后 从 其 他 昆虫 中 鉴 
定 新 的 apd 基因 。 

关键 词 : 西方 塞 蜂 ; 东方 蜜蜂 ; KEEA; apidermin 基因 ; APD 家 族 ; 序列 分 析 ; 生物 信息 学 分 析 

中 图 分 类 号 : Q966 ”文献 标识 码 : A ”文章 编号 : 0454-6296(2012)01-0012-12 

Characterization of three new members of the apidermin (apd) gene family 


from honeybees and sequence analysis of the insect APD family 

SUN Liang-Xian"" , HUANG Zhou-Ying , ZHENG Hua-Jun’, GE Qing-Xiu , GONG Li-Ping , CHEN 
Huai-Yu (1. The Higher Educational Key Laboratory for Molecular Biology and Pharmacology of Fujian 
Province, Quanzhou Normal University, Quanzhou, Fujian 362000, China; 2. Chinese National Human 
Genome Center at Shanghai, Shanghai 201203, China) 

Abstract: The apidermin ( APD) protein family is a novel structural cuticular protein family of insects. To 
gain a better understanding of this protein family, by using bioinformatics and RT-PCR amplification, we 
identified three novel apd genes ( apd-1-like, apd-3-like from Apis mellifera ligustica, and apd-2 from Apis 
cerana cerana) and investigated their structural features, and then we revealed the characteristic motifs of 
the APD family. The results showed that a cluster of six apd genes were tandemly arranged on chromosome 
4 of Apis mellifera. These apd genes were differentially expressed in drone head of A. m. ligustica, and 
their expression pattern was consistent with that of the cis-acting elements in their promoter sequences. The 
genomic DNA of apd-2 from 4 . c. cerana and apd-1-like from A. m. ligustica contain three exons and two 
introns while that of apd-3-like from A. m. ligustica contain four exons and three introns. As the deduced 
proteins of the apd genes were analyzed, it was found that the presently available 10 APDs possess similar 
N-terminal signal peptide sequences. The mature APD proteins ranged in size from 6. 0 to 37. 0 kD, and 
their pl ranged from 6.2 to 10. 8. Intriguingly, five small APD proteins, including APD-2 from A. cerana, 
and APD 1 -3 and APD-like from A. mellifera, were rich in hydrophobic amino acid residues (52% — 
67% ) with Ala being the most abundant (2596 — 3496 ). However, the other five larger APDs, including 
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APD 1 -3 from Nasonia vitripennis, and APD-1-like and APD-3-like from A. mellifera, were Gly-rich 
(2196 -30% ) proteins with hydrophobic amino acid residues constituting 3596 — 4196 of their amino acid 


sequences. Multiple alignment and phylogenetic analysis revealed that the APD protein family could be 


classified into two subfamilies. Subfamily [ , which contains four low complexity sequences ( APD 1 -3 


from A. mellifera and APD-2 from A. cerana), was characterized by a 33-aa N-terminal conserved motif. 


The other six larger APD proteins were classified as subfamily [[ , which was featured by a 50-aa N-terminal 


motif and a 16-aa C-terminal motif. The diagnostic features of APD protein family described here will be 


very helpful for identifying novel apd genes from arthropods. 


Key words: Apis mellifera; Apis cerana; cuticular protein; apidermin gene; APD family; sequence 


analysis; bioinformatical analysis 


昆虫 表皮 (外 骨骼 ) 是 体 壁 上 皮 细 胞 分 泌 物 形 
成 的 一 种 高 度 有 序 的 层 状 结构 , 具有 高 等 动物 的 皮 
肤 和 骨骼 的 双重 功能 ,对 运动 、 保 持 水 分 、 维 持 躯 
体 结构 、 抵 御 外 界 生物 胁迫 和 非 生物 胁迫 都 有 重要 
的 作用 (Willis et al., 2005; xig, 2006; 孙 虹 
霞 等 , 2007) 。 昆 虫 表皮 的 主要 成 分 是 几 丁 质 和 多 
种 结构 性 表皮 有 重 日 (euticular proteins, CPs), JLT 
质 是 由 N- 乙 酰 -D- 葡 糖 胺 单 体 以 B-(1,4) BEEF ER 
合 形成 的 同 多 糖 , 呈 网 状 微 丝 的 形式 包 埋 在 由 CPs 
组 成 的 基质 内 。 不 同 表皮 的 几 丁 质 分 子 链 长 和 乙酰 
化 程度 差异 很 小 , 而 CPs 种 类 和 数量 的 变化 是 影响 
表皮 结构 和 机 械 性 质 的 重要 因素 ( Andersen et al., 
1995) 。 对 CPs 的 研究 有 助 于 阐明 昆 忠 表皮 的 结构 
和 生理 功能 。 

Snyder 等 (1982 ) 首次 报道 了 4 RR 
Drosophila 的 CP 序列 , Æ 1995 年 已 报道 的 CP 序列 
为 38 条 (Andersen et al., 1995) , 至 2005 年 已 发 表 
的 CP 序列 已 达 139 Z& (Willis et al., 2005) 。 近 年 
jk, 随 着 DNA 测序 技术 的 快速 发 展 ， 黑 腹 条 蝇 
Drosophila melanogaster, X] HE MV. fà E Anopheles 
gambiae, Vi 7j t% Apis mellifera (fj fk PIE”), Z 
看 Bombyx mori, WM IRINE E/M Nasonia vitripennis 
及 分 属 不 同属 的 2 PERY (Camponotus floridanus 和 
Harpegnathos saltator ) 等 昆虫 的 全 基因 组 序列 被 陆 
z Mj JZ, GenBank 中 的 昆虫 基因 cDNA 和 ESTs 
( expressed sequence tags) 序 列 也 迅速 积累 。 基 于 与 
已 报 赴 的 表皮 午 日 序列 的 相似 性 , 科学 家 从 这 些 核 
酸 序 列 中 鉴别 到 数 以 百 计 的 表皮 和 蛋白 基因 (冈比亚 
Tic, 240 个 ; KA, 221 个 ; 黑 腹 条 蝇 ,，155 个 ; BN 
晶 师 集 金 小 蜂 ，76 个 ) (Willis, 2010; http:// 
bioinformatics2. biol. uoa. gr/cuticleDB/) ,但 迄今 为 
止 从 西方 蜜蜂 基因 组 中 鉴别 到 的 CP 基因 仅 有 48 
个 (The Honeybee Genome Sequencing Consortium, 
2006; Willis, 2010; 孙 亮 先 等 , 2011), 远 少 于 从 其 


他 已 测序 昆虫 中 发 现 的 CP 基因 数 。Willis( 2010) 
根据 和 蛋白 序列 特征 将 昆虫 结构 性 CP 划分 为 CPR 
(根据 Rebers and Riddiford Consensus 命名 )、CPF 
(根据 一 段 高 度 保守 的 长 44 aa 的 区 域 命名 )、CPFL 
( CPF like) 和 apidermin 等 12 个 家 族 。 

昆虫 表皮 和 蛋 日 apidermin (APD ) 家 族 是 根据 西 
方 蜜蜂 的 3 CREEA APD 1 -3 而 命名 的 。 上 有 目前 
已 报道 的 apidermin 家 族 成 员 重 白 有 7 个 , 包括 西 
方 蜜蜂 的 APD 1 -3, APD-like 和 丽 蝇 晴 集 金 小 蜂 
的 APD 1 -3( Willis, 2010), AD EIH 4^ apd 
基因 串联 排列 在 第 4 号 连锁 群 上 的 一 段 寅 含 CC 区 
域 的 区 域内 , 其 成 熟 的 产物 和 蛋 昌 的 分 子 量 为 6.0 ~ 
12.0 kD, 而 丽 蝇 肾 集 金 小 蜂 的 3 个 apd 基因 的 成 
融 产 物 重 日 相对 较 大 (21.6 ~37.0 kD), HF APD 
和 集 日 序列 数量 有 限 , 目前 国内 外 尚未 揭示 可 定义 该 
重 日 家 族 的 特征 序列 , 而且 尚未 能 在 膜 翅 目 外 的 其 
他 昆 忠 基因 组 中 发 现 类 似 和 蛋白 。 鉴 于 昆 忠 CP ERA 
基因 常 以 基因 簇 的 形式 串联 排列 在 基因 组 DNA FE 
列 上 (Togawa et al., 2008; Cornman et al., 2009 ) ， 
本 研究 分 析 了 西方 塞 蜂 已 知 apd SEPAN XE BLA 
预测 基因 位 。BLAST 相似 性 搜索 结果 揭示 有 2 个 
预测 基因 的 产物 重 日 与 丽 蝇 晴 集 金 小 蜂 的 APD-1 
和 APD-3 序列 具有 较 高 的 一 致 性 , 因此 将 其 命名 为 
apd-l-like 和 apd-3-like, 4€ 1|] Hj RT-PCR 克隆 了 
apd-3-like 基因 的 cDNA 序列 , 并 利用 我 们 发 表 的 一 
个 西方 蜜蜂 雄 蜂 头 部 5'LongSAGE 文库 中 的 标签 数 
据 (Zheng et al. , 2011 ) 分 析 了 西 蜂 apd 基因 家 族 6 
个 成 员 的 转录 丰 度 和 转录 起 始 位 点 (transcription 
start site, TSS) 。 继 而 我 们 利用 这 6 个 西方 塞 蜂 apd 
基因 的 cDNA 序列 查询 了 中 华 蜜蜂 Apis cerena 
cerena ( 简称 “中 蜂 ”) 的 ESTs 数据 库 (Sun et al., 未 
发 表 数 据 ) 和 中 蜂 全 基因 组 序列 (东方 蜜蜂 Apis 
cerena 基因 组 测序 项 目 组 , 未 发 表 数 据 ) ,结果 在 
469 162 条 ESTs 中 发 现 了 4 条 匹配 ESTs 序列 ， 经 
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拼装 后 获得 了 一 条 编码 APD-2 的 全 长 cDNA, 同时 
获得 了 apd-2 基因 的 基因 组 DNA 序列 。 在 此 基础 
E, 本 研究 利用 来 源 于 蜜蜂 和 丽 晶 肾 集 金 小 蜂 的 10 
条 APD 多 肽 序列 分 析 了 apidermin 蛋 日 家 族 的 特 
ÎE, 发 现 该 蛋 日 家 族 成 员 没 有 明显 的 保守 序列 。 然 
而 在 将 这 10 条 乍 日 序列 划分 为 2 个 亚 家 族 后 , S 
果 发 现 亚 家 族 拥有 其 特征 性 基 序 。 本 研究 首次 报道 
了 apidermin REA ZKI, ERN 
ER APD 和 蛋白 的 鉴定 提供 了 依据 。 
1 材料 与 方法 
L1 供 试 材料 

意大利 蜜蜂 Apis mellifera ligustica (简称 “ 意 
蜂 ”) 和 中 蜂 A. c cerana 蜂 群 饲养 在 累 州 师范 学 院 
模式 生物 研究 中 心 的 实验 蜂 场 。 捕 捉 新 出 房 的 中 蜂 
工蜂 1 头 , 意 蜂 工 蜂 和 雄 蜂 各 1 头 。 撕 取 头 胸部 用 
于 提取 总 RNA。 
1.2. RNA 提取 与 反 转 录 合 成 第 一 链 cDNA 

样品 中 加 入 0.2 mL TRIzol 试剂 (Invitrogen ， 
San Diego, CA), 3& ^r BE ES Ji ĦA 0. 8 mL 
TRIzol, $E Trizol 试剂 盒 说 明 书 提取 总 RNA, W 
1 pL 总 RNA 溶液 于 1% 琢 脂 糖 凝 胶 电泳 检测 。 取 
2 ug 总 RNA, 以 MMLV ( Moloney-murine-leukaemia 
virus) iJ ff 5X Hj ( MBI Fermentas 公司 ，Vilnius， 
Lithuania) 合成 第 一 链 cDNA， 具 体 方法 参照 
RevertAid Firststrand cDNA Synthesis Kit 说 明 书 。 
1.3 PCR 引物 设计 

V4 BLAST( http://blast. ncbi. nlm. nih. gov/) 对 
西 蜂 基因 组 序列 上 apd SEDI (apd 1 —3, apd-like) 
附近 的 预测 基因 座 ( 图 2: A) 进 行 功 能 注释 , 根据 
BLAST 结果 判断 预测 基因 座 是 否 编码 APD & Él. 
以 图 2(B) 所 示 的 4 对 PCR 引物 对 西 蜂 预测 基因 座 
LOC409716 的 cDNA 序列 进行 克隆 , 其 中 上 游 引 物 
为 意 蜂 5'LongSAGE 文库 (GEO 登录 号 : GSEI9555) 
中 的 4 条 5'LongSAGE 标签 序列 : 5'-CAGTCAATCA 
CCGGACTAC-3', 5'-AGTCAATCACCGGACTACC-3', 
5'-GTCAATCACCGGACTACCA 3'f 5'-AATCACCGG 
ACTACCAGCC-3'; 下 游 引 物 根 据 LOC409716 最 后 
一 个 外 显 子 设计 , 序列 为 5'-GGGGATGATAGCTCC 
GTGAG-3'。 西 蜂 预 测 基 因 座 LOC727131 的 cDNA 
片段 的 扩 增 采用 引物 对 5’-TTTTCTCGTCTTGGTCGC 
A-3' 和 5’-GTCCCGTGGCGCAGTGATTT-3'。 用 引物 对 
5'-ATCCCTGTTAATCCTCTTCG-3' fi 5'-TTCCCATCA 
TCGTTGTTT-3'3 t% h i% apd-2 基因 的 cDNA Fr Ez. 


引物 序列 委托 上 海 基 康生 物 技术 有 限 公司 合成 。 
1.4 RT-PCR 扩 增 与 PCR 产物 克隆 

取 意 蜂 雄 蜂 、 工 蜂 和 中 蜂 工 蜂 的 第 一 链 cDNA 
作为 模板 , 分别 用 于 RT-PCR 扩 增 意 蜂 预 测 基 因 座 
LOC409716, LOC727131 和 中 蜂 apd-2 基因 的 cDNA 
FEto PCR 反应 体系 为 : 模板 1 uL, DreamTaq™ 
Green PCR Mix (2x) (Fermentas 公司 ) 25 uL, E 
洲 和 和 下游 引物 (2 pg/gL) ^4 1 pL, nuclease-free 
water 22 uL, PCR 反应 程序 为 : 95?C 变性 3 min; 
95%C 30 s, 52%C 30 s, 72% 1.5 min; 35 轮 循环 ; 
72% 保温 10 min; Et 2 uL PCR 产物 于 1 96 琼脂 糖 
电泳 检测 。 将 预测 基因 座 LOCA09716 的 PCR 产物 
用 大 孔 1.5% 球 脂 糖 凝 胶 电 泳 后 ,紫外 灯 下 切 下 目 
的 条 带 , FH E. Z. N. A™ Gel Extraction Kit ( Omega 
公司 ) 纯化 回收 PCR. 产物 , 然后 用 InsTAclone " 
PCR Cloning Kit( Fermentas 公司 ) 将 回收 的 PCR 产 
物 克 隆 进 pTZS57 RAT 载体 测序 。 有 具体 操作 参照 试剂 
盒 说 明 书 。 
1.5 At apd 基因 家 族 成 员 转 录 起 始 位 点 和 表达 
丰 度 分 析 

利用 意 蜂 雄 蜂 头 部 5'LongSAGE 文库 (http:// 
www. ncbi. nlm. nih. gov/geo/, 2g: GSEI9555) 中 
定位 在 基因 组 序列 连锁 群 Contig1775 上 的 5' 
LongSAGE 标签 序列 分 析 各 apd 基因 的 转录 起 始 位 
点 (TSS) 和 在 意 蜂 雄 蜂 头 部 中 的 转录 水 平 。 标 签 序 
列 的 5 末端 第 一 个 碱 基 在 基因 组 上 的 位 置 可 代表 
一 个 TSS, 各 标签 序列 的 拷贝 数 代 表 RNA Pol II gi 
该 TSS 起 始 转 录 的 频率 (Zheng et al., 2011), 
1.6 西 蜂 apd 基因 启动 子 序列 的 分 析 

在 定位 西 蜂 apd 基因 的 TSS 之 后 ， 用 
DNASTAR 软件 在 基因 组 序列 上 截取 优势 TSS 上 游 
1 kb 至 下 游 100 bp 的 序列 , 在 线 分 析 (http://www. 
cbrc. jp/research/db/TFSEARCH. html) 启动 子 序列 
含有 的 转录 因子 (TF) 结合 位 点 , 并 用 Photoshop 4X 
件 按 比例 绘制 顺 式 作用 元 件 分 布 图 。 
1.7 蜜蜂 apd 基因 的 内 含 子 / 外 显 子 分 析 

在 NCBI 网 站 上 以 BLAST 程序 将 西 蜂 apd 基因 
的 cDNA 序列 与 西 蜂 基因 组 序列 进行 比 对 , 根据 
BLAST 结果 在 Contig1775 上 标注 出 各 apd 基因 的 外 
显 子 /内 合子 结构 。 同 时 , 利用 中 蜂 脑 ESTs 数据 库 
中 的 数据 ( 孙 亮 先 和 郑 华 匣 , 未 发 表 数 据 ) 获得 中 蜂 
apd-2 基因 的 全 长 cDNA 序列 , 用 此 cDNA 序列 
BLAST 查询 中 蜂 全 基因 组 序列 (东方 蜜蜂 基因 组 测 
序 项 目 组 , 未 发 表 数 据 ) ， 获 得 中 蜂 apd-2 基因 的 基 


1 期 ” 孙 亮 先 等 : 蜜蜂 表皮 重 白 apidermin (apd) 基 因 家 族 3 个 新 成 员 的 特性 鉴定 及 昆虫 APD 家 族 序列 特征 的 分 析 15 


因 组 DNA 序列 及 其 外 显 子 /内 合子 组 成 。 
1.8 APD 蛋白 信号 肽 序列 预测 与 生化 特性 分 析 

用 SignalP 3. 0 软件 ( Bendtsen et al., 2004) 在 线 
(http://www. cbs. dtu. dk/services/SignalP/ ) 对 已 知 
apd 基因 的 产物 蛋白 进行 信号 肽 序列 预测 。 用 
DNASTAR 软件 分 析 APD 和 蛋白 序列 的 氨基 酸 组 成 及 
其 成 熟 和 蛋白 的 分 子 量 和 等 电 点 。 
1.9 APD 蛋白 序列 的 多 重 比较 与 系统 进化 分 析 

用 MEGA 4.0 软件 包 中 的 ClustalW 程序 对 APD 
蛋白 序列 进行 多 重 比 较 , 并 按 Neighbor-joining (NJ) 
法 构建 系统 进化 树 , 分 析 时 使 用 程序 默认 参数 。 


2 结果 与 分 析 


2.1 意 蜂 apd-3-like 和 apd-1-like 以 及 中 蜂 apd-2 3 
个 表皮 蛋白 基因 的 鉴定 及 实验 验证 

昆虫 表皮 和 蛋 日 基因 家 族 常 以 基因 簇 的 形式 串联 
分 布 在 染色 体 上 ( 梁 九 波 等 ,2008)。 根 据 此 特点 ， 
本 研究 以 BLASTP 对 西峰 基因 组 序列 上 已 知 apd 基 
因 簇 周围 的 基因 座 进行 了 分 析 , 结果 发 现 预测 基因 
座 L0C727131 和 LOC409716 的 产物 蛋白 与 丽 晶 肾 
集 金 小 蜂 的 表皮 和 蛋白 APD-1 和 APD-3 的 序列 相似 
性 分 别 达到 51.2% 和 77.9% , 因此 , 我 们 将 这 2 个 
基因 分 别 命 名 为 apd-1-like 和 apd-3-like。 

为 了 验证 预测 基因 座 LOC727131 和 
LOC409716 的 存在 , 本 研究 以 RT-PCR 对 它们 的 
cDNA 片段 进行 了 扩 增 , 结果 获得 了 预期 长 度 的 目 
的 请 段 (图 1: A, B)。 使 用 定位 在 LOCA09716 转录 
起 始 位 点 附近 的 4 条 5'LongSAGE 标签 序列 (图 2: 
B ) 分 别 作为 RT-PCR 上 游 引 物 , PCR 产物 经 克隆 测 
序 后 得 到 4 条 分 别 长 845, 847, 849 和 852 bp 的 


A M B 
bp l bp 
p X 
1600 — t | 


7e wi — 
700 — 
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400 — —— 





700 — Mu 
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cDNA 序列 ( GenBank. 登录 号 分 别 为 : JN627499 ， 
GU358200 - GU358203) , 3x 4 条 cDNA 序列 除了 5 
端 相 差 几 个 碱 基 外 , 其 他 序列 完全 相同 。 图 1(B) 
为 LOC727131 的 RT-PCR 扩 增 片段 , 其 长 度 与 预期 
结果 (561 bp) 相符 。 

为 了 探索 东方 蜜蜂 是 否 也 存在 apd 基因 , 本 研 
究 将 6 个 西 蜂 apd 基因 的 cDNA 序列 用 BLAST 程序 
查询 了 中 蜂 ESTs 数据 库 ( 孙 之 先 和 郑 华军 , 未 发 表 
数据 ) ， 结 果 发 现 了 4 条 与 apd-2 基因 相 匹 配 的 
ESTs 序列 ， 经 拼装 后 得 到 一 条 长 507 bp 的 全 长 
cDNA 序列 ( GenBank. 登录 号 : JN627497), iX 
cDNA 编码 一 条 长 76 aa 的 多 肽 ,其 序列 与 西 蜂 
APD-2 的 序列 相似 性 为 88.3% , 因此 将 该 蛋白 命名 
为 APD-2。 图 1(C) 为 中 蜂 apd2 基因 的 RT-PCR 验 
证 结果 ,所 得 片段 长 度 与 预期 结果 (301 bp) 吻合 。 
用 中 蜂 apd-2 基因 的 全 长 cDNA 序列 查询 中 蜂 全 基 
因 组 序列 (东方 蜜蜂 基因 组 测序 项 目 组 , 未 发 表 数 
据 ) 获得 了 该 基因 的 全 长 基因 组 DNA 序列 (长 
1 631 bp ，GenBank 登录 号 : JN627498 ) 。 

鉴定 了 3 个 apd 新 基因 之 后 , 本 人 研究 对 来 自 蜜 
蜂 的 7 个 apd 基因 的 碱 基 组 成 进行 了 比较 ( 表 1)。 
西 蜂 apd-1-like 和 apd-3-like 的 cDNA 序列 中 的 C+ 
G 含量 分 别 为 S0.5% 和 64.6% ,而 它们 的 基因 组 
DNA 序列 的 C+G 舍 量 略 低 , 为 42.096 M 51.7%, 
东方 蜜蜂 apd-2 基因 的 cDNA 序列 和 基因 组 DNA JF 
列 的 GC 含量 分 别 为 36.0% 和 45.8%。 由 表 1 可 
JL, 蜜蜂 apd 基因 的 基因 组 DNA 序列 中 的 C+G 会 
量 达 36.6%~58.6% , 高 于 西 蜂 基因 的 平均 GC E 
量 ( 29%) ( The Honeybee Genome Sequencing 
Consortium, 2006) , ， 因 此 富 含 GC 可 能 是 蜜蜂 apd 
基因 的 特征 之 一 。 
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图 1 意 峰 apd-3-like 基因 (A) 和 apd-1-like 基因 (B) 以 及 中 蜂 apd-2 基因 (C) 的 RT-PCR 结果 
Fig. 1 RT-PCR results of apd-3-like ( A) and apd-1-like (B) from Apis mellifera ligustica and apd-2 from Apis cerana cerana (C) 
M: DNA ladder. 
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X1 蜜蜂 apd 基因 的 cDNA 和 基因 组 DNA 的 长 度 和 碱 基 组 成 


Table1 Length and base composition of cDNA and genomic DNA sequences of apd genes from honeybees 


基因 基因 的 来 源 GenBank 登录 号 A«T G+C 长 度 (bp) 
Gene Source of gene GenBank accession no. (%) (%) Length 
cDNA (NM 001174144) 30.71 69.29 534 
Apd-like Apis mellifera 
Genomic DNA (LOC727145) 41.43 58.57 753 
cDNA ( XM, 001122844) 49.52 50. 48 1 153 
Apd-1 -like A. mellifera 
Genomic DNA (LOC727131) 58. 00 42.00 2 038 
cDNA ( JN627499) 35.39 64. 61 828 
Apd-3 like A. mellifera 
Genomic DNA (LOC409716) 48.35 51.65 3 036 
cDNA ( XM, 625244) 39.76 60. 24 1 328 
Apd-1 A. mellifera 
Genomic DNA ( LOC551367 ) 59.24 40.76 2 149 
cDNA (NM 001085346) 53.83 46. 17 509 
Apd-2 A. mellifera 
Genomic DNA ( LOC727161) 63.36 36. 64 1 168 
cDNA ( NM, 001085344) 45.24 54.76 515 
Apd-3 A. mellifera 
Genomic DNA (LOC100037419) 57.57 42.43 839 
cDNA ( JN627497) 63.99 36.01 507 
Apd-2 A. cerana 
Genomic DNA ( JN627498) 54.24 45.76 1 208 


2.2 西 蜂 apd Æ Bl BJ e KEE Ja Dur ex Jc TE RE E SI RD 
中 的 转录 水 平 

西 蜂 的 6 个 apd 基因 串联 排列 在 第 4 号 染色 体 
的 一 段 长 35.9 kb 的 DNA 序列 内 (图 2: A), JE 
DNA KEEA GC(41% ) 。 根 据 5'LongSAGE 标签 
可 准确 定位 转录 起 始 位 点 的 特点 (Wei et al., 2004; 
Zheng et al., 2011) ， 本 研究 利用 雄 蜂 5' LongSAGE 
文库 中 的 标签 在 基因 组 序列 上 定位 了 西 蜂 apd 基因 
的 TSS, 并 分 析 了 它们 在 意 蜂 雄 蜂 头 部 的 转录 水 平 
(图 2: B - G), 5'LongSAGE 标签 定位 结果 显示 ， 
apd 基因 具有 选择 性 TSS, 即 PolE 能 在 不 同 TSS 上 
以 不 同 的 频率 起 始 转录 。 如 apd-3-like FE WEIER XR 
可 由 9 个 TSS 起 始 转录 , 其 中 在 一 个 优势 TSS 上 起 
始 了 该 基因 90 多 的 mRNA( 图 2: B)。 有 4 条 标签 
序列 被 定位 在 apd-1-like 基因 的 起 始 密码 子 上 游 
(图 2: C), 从 而 在 转录 水 平 上 证 实 了 LOC727131 
的 存在 ; 而 RT-PCR 结果 (图 1: C) 则 验证 了 
LOC727131 的 编码 序列 。 定 位 在 不 同 apd 基因 的 5 
LongSAGE 标签 拷贝 数 为 apd-3-like: apd-like: apd-2: 
apd-l-like: apd-3: apd-1 = 1 044: 429: 416: 10:1:0( 图 
2: B~G), 显示 不 同 apd 基因 在 意 蜂 雄 蜂 涉 部 的 表 
达 丰 上 度 存 在 显著 差异 。 
2.3 At apd 基因 启动 子 序列 的 顺 式 作 用 元 件 

真 核 生物 基 因 的 启动 子 区 一 般 位 于 TSS 上 游 
300 bp 至 下 游 50 bp 之 间 。 在 用 5'LongSAGE 标签 


序列 定位 了 西 蜂 apd 基因 的 TSS 后 , 本 研究 对 其 局 
动 子 序 列 的 转录 因子 结合 位 点 进行 了 预测 , 结果 见 
图 3。 由 图 中 可 见 , 6 个 西 蜂 apd 基因 的 局 动 子 序 
列 除 含有 一 个 典型 的 TATA 框 外 , 还 都 含有 3 ~ 有 
个 热 激 因子 结合 元 件 (HSE), 暗示 这 些 基 因 的 表达 
会 受 温度 影响 。Apd-3-like 基因 的 TATA 框 上 洲 418 
bp 处 有 一 个 CFI 结合 位 点 ,而 CFI 是 类 固 醇 受 体 
家 族 的 一 个 成 员 (Shea et al., 1990) , 因此 apd-3-like 
的 表达 可 能 会 受 晓 皮 激素 信号 分 子 的 间接 调控 。 除 
apd-3-like 基因 外 ,其 他 5 个 蜜蜂 apd 基因 的 启动 子 
区 都 含有 1 ~3 个 Dfd (deformed) 转录 因子 结合 位 
点 。Dfd 是 决定 果 蝇 早期 发 育 中 形成 头 部 体 分 市 的 
一 个 重要 转录 因子 (Lohmann et al., 2002) ,因此 这 
5 个 apd 基因 可 能 是 Dfd 和 蛋白 的 靶 基 因 , 其 产物 重 
日 可 能 会 在 蜜蜂 胚胎 期 涉 部 形态 形成 的 过 程 中 起 作 
用 。 此 外 ,apd-like, apd-2 和 apd-3 等 3 个 基因 的 局 
动 子 区 含有 一 个 Hb (hunchback) 转录 因子 结合 位 
点 ; apd-l-like, apd-3-like 和 apd-3 的 司 动 子 含有 
1 ~2 个 Bed ( BICOID) 转录 因子 结合 位 点 ; apd-1- 
like 的 局 动 子 还 含有 一 个 Kr ( Kruppel) 结合 位 点 ， 
apd-like W J& 54 Y EA — ^r HL JS 3X4 E Ubx 
( Ultrabithorax) 结合 位 点 。Hb, Kr, Bed 和 Ubx 都 是 
果 蝇 胚胎 发 育 中 重要 的 转录 调控 因子 , 其 中 Hb 和 
Bed 在 调控 胚胎 前 端 结 构 的 形成 过 程 中 起 着 关键 作 
用 , 而 Upx 在 第 二 胸 节 分 化 中 起 调控 作用 
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LOC409716 LOC727131 LOC727136  LOC727145 1000337419 LOC551367 LOC727161 
2845925 k 2858871 k 4 2863879 2868116 b 2871348 b 2878007 28818564 
2848950 2860908 2865471 2868792 2872263 2879490 2880673 
apd-3-like apd-1-like apd-like -> apd-3 apd-1 apd-2 
3026 bp 2037 bp 1593 bp 676 bp 875 bp 1484 bp 1184 bp 
B  apd-3-like ea 2» Start codon of LOC409716 For antisense primer Stop codon of LOC409716 
Direction of transcription 
2845829 pe Mr É 2848950 
Genomic sequence 5*... cGTAGCCAGAGTAGAGTTAGGCGTATATAAGGCCCGCCGGCCCOGCCCAAGTCAGTCAATCACCGGACTACCAGCCCACCATACACACACCAAACATO] ---3133 3 *p-- CICACGCAGCTRTCATCCCC GGGGCACTCGGCAAGTACITAG -3° 
GTAGCCAGAGTAGAGTTAG GGCCCGGCCCAAGTCAGTC 
AAGTCAGTCAATCACCGGA 1 
AGTCAGTCAATCACCOGAC 1 
: CAGTCAATCACCGGACTAC 
Tags used as sense primers E n 1044 

933 

C EAATCACCUGAETACCAG e 

AATCACCGGACTACCAGCC 2 

19 

C  apd-l-like Direction of transcription — Part codon of LOC727131 For sense primer For antisense primer Stop codon of LOC727131 
2858835 一 > 2860388 


Genomic sequence 5^-G6TTCGTGGGCACACTCAGCAATCGGTCGATGAGGAAG[ATGA—561 bp---C TTTTCTCG TC TTGG TC GCA G-—-965bp-—- CARAATCACTGCCCACCGGACAGGTTACGGAGCGATCCACTCTGGCCACTCTGGCCATTGG[TAA]cG -3° 


GGGCACACTCAGCAATCGG 
GGCACACTCAGCAATCGGT 
GCACACTCAGCAATCGGTC 
ACACTCAGCAATCGGTCGA 


D  apd-like 
2868037 Direction of transcription 


Start codon of LOC727145 


1 
1 
; Jn 
6 


Stop codon of LOC727145 
2868797 


一 一 一 一 一 一 
Genomic sequence 5'-GT SACRE CACC eg CACCGAGCCAAACTGTTCCACCAGCTTGGAAAAGCGAACAAGCCC TTCGAGCAAAC[ATG].. -641 bp----G ———— GACATT GdTAATCCCT - -3' 


ACAGCACATCCACCCGA 


GCACATCCACCCGAGCCAC 
ATCCACCCGAGCCACCGAG 
E  apd-3 


2871440 Direction of transcription 


Start codon of apd-3 


13 
388 
3 
17 
1 


429 


Stop codon of apd-3 
|. 2872136 


一 > 
Genomic sequence 5'- TTAGCAGTGTCOGCAATTAACGCGATAGACAAGTAGT TAAGAAGCGGATCOGAGCAAT C[RTO]--—.--623 bp---- AAAGTAACGAATAAATAAAT TTTCAGGACT TGCATCT GTACT CGCTCACC AT(TGA] - 3° 


AGCAGTGTCGCAATTAACG 


1 


F  apd-1 Start codon of apd-1 Stop codon of apd-1 
2878007 ! 2880024 
Genomic sequence — 5- ATCAGTCACTAGCAAGCTAAAGACTAACCACAACGCAAT CAAT(ATO -—.. 1917 bp --——-GGATTTATTTATTGATATTGATACTCAAGAT GAAT C GACGAATCAAC TTAAT[TAR-.. 3" 
apd-2 S n» Start codon of apd-2 Stop codon of apd-2 
Direction of transcription 
2881902 2880694 
—— 
Genomic sequence 5 AAATAAGAGTATAAAAGACAAACCCGATACCTGCATTTTCATCAGTCGCTTGCGATTTCGAGTTCCAAGAAGCTCAAGTTAATCAACACAT A[KTO]— 10880p— AT TTAAATTATATTATCAGACAA[TAR -3° 
AAAAGACAAACCCGATACC 1 
AAAGACAAACCCGATACCT. 1 
AAGACAAACCCGATACCTG 4 
AGACAAACCCGATACCTOC. 1 
GACAAACCCGATACCTGCA. 3 
AAACCCGATACCTGCATTT 2 416 
GCATTTTCATCAGTCGCTT. 4 
ATCAGTCGCTTGCGATTT. 2 
ATCAGTCGCTTGCGATTTC. 383 
AGTCGCTTGCGATTTCGAG 


图 2 西 蜂 apd 基因 家 族 成 员 在 基因 组 序列 上 的 分 布 及 其 转录 起 始 位 点 


Fig. 2 Distribution of the apd family members on genomic sequence of Apis mellifera and their transcription start sites 
A: apd 基因 在 contig1775 序列 中 的 位 置 , 长 箭头 表示 转录 方向 ， 短 箭头 表示 编码 序列 的 起 始 位 置 The relative position of apd genes in 
contigl775. Long arrows indicate the transcription direction and short arrows indicate the initiation site of start codon; B - G: 定位 在 apd 基因 的 转录 起 
始 位 点 周围 的 5'LongSAGE 标签 序列 The tag hits around transcription start site of apd genes. 标签 来 自 于 西方 蜜蜂 成 年 雄 蜂 头 部 的 5'LongSAGE X 


E, 标签 数量 代表 mRNA 由 该 位 点 起 始 转 录 的 频率 , 编码 序列 的 起 始 密码 子 ATG 和 终止 密码 子 TAA 用 方 框 黑体 标志 , MIE RT-PCR 引物 序 
列 的 5'LongSAGE 标签 用 下 划 线 标志 。The tag sequences come from a 5'LongSAGE library of adult drone head. The number of tags indicates the 


initiation efficiency. The start codon and stop codon are marked with boxed-bold letter. The sequences used for designing PCR primers are underlined. 


( Papatsenko and Levine, 2008; Okabe-Oho ef al., 
2009; Choo et al., 2011) 。 因 此 蜜蜂 apd 基因 可 能 
会 在 Hb, Bed, Kr 和 Ubx 等 转录 因子 的 调控 下 参与 
蜜蜂 胚胎 形态 的 发 生 。 同 时 , 根据 不 同 apd 基因 的 
司 动 子 区 所 含有 转录 因子 结合 位 点 存在 差异 的 特 
点 ,我 们 推测 它们 在 蜜蜂 的 不 同 发 育 时 期 和 不 同 组 
织 会 呈现 不 同 表达 方式 。 
2.4 ZE apd 基因 的 的 外 显 子 /内 含 子 结构 
图 4 比较 了 7 个 蜜蜂 apd 基因 的 外 显 子 /内 合 
结构 。 从 图 中 可 见 除 apd-like 外 的 另外 6 个 基因 
的 第 一 个 外 显 子 部 很 短 (12 ~ 57 bp)。 东 方 蜜蜂 
apd-2 与 西 蜂 apd 1 -3 和 apd-1-like 等 5 个 基因 都 


由 3 个 外 显 子 和 2 个 内 含 子 组 成 ; 而 apd-3-like 含 4 
个 外 显 子 和 3 个 内 含 子 , 且 其 第 一 个 内 含 子 长 达 
1 978 bp, Apd-like LEE 2 个 外 显 子 , 其 中 第 一 个 
外 显 子 长 389 bp。 内 合子 边界 序列 分 析 发 现 , 7 个 
蜜蜂 apd 基因 的 内 含 子 都 属于 GU-AG 型 。 需 要 说 
明 的 是 , 由 于 用 于 注释 基因 结构 的 apd-like 和 
3-like 的 cDNA 序列 3" 并 为 终止 密码 子 , 尚 缺少 
UTR 序列 , 所 以 所 注释 的 最 后 一 个 外 显 子 在 3" A 
不 完整 。 
2.5 昆虫 APD 蛋白 的 生化 性 质 

为 了 清晰 昆虫 APD 重 日 的 生化 特性 ,本 人 研究 
分 析 了 10 个 apd 基因 产物 和 蛋 日 的 信号 肽 、 分 子 量 、 


18 昆虫 学 报 Acta Entomologica Sinica 55 Xr 


网 ü e E A 


HSE TATA Dfd CF2-II Bcd 


apd-like 


e$ e Uo oH g # 
Hb 


Adf-1 Ubx CF1 / dl 


3 — — 8— —À8— —k€— —m8— mj —— — — ——4—— — — —a—— — —— ]- — —— ATG 3' 


Kr 


apd-I-like —.5' ——————38—849— ——38——46—3:8——8—18—::——8— — —8— — — án — ^16 3 


apd-3-like 


apd-1 


apd-2 


apd-3 





图 3 西 蜂 apd 基因 局 动 子 序列 含有 的 预测 转录 因子 结合 位 点 
Fig. 3 Scheme of putative transcription factor binding sites in promoter region of apd genes from Apis mellifera 
箭头 表示 优势 转录 起 始 位 点 ，ATC 表示 起 始 密码 子 。The dominant transcription start site is indicated with arrow, and ATG is the start codon. 
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图 4 蜜蜂 apd 基因 的 内 含 子 /外 显 子 结构 
Fig. 4 Intron/exon organization of apd genes from honeybees 


外 显 子 和 内 含 子 分 别 用 灰色 和 黑色 框 表示 , 横 坐 标 上 的 数字 为 实际 碱 基 对 。Exons and introns are depicted as gray and black boxes, respectively , 


the numbers on the x-axis display the actual sizes in base pairs. 


等 电 点 和 aa 组 成 ( 表 2) 。 信 号 肽 预测 结果 显示 ， 
APD Æ AJIN ZR RU — Ex eb a LK TE a s 
的 信号 肽 序列 , 表明 该 类 APD Z& FL2J AT UD EC EA e 
其 中 , 除了 丽 蝇 肾 集 金 小 蜂 APD-2 蛋白 的 信号 肽 序 
列 长 为 22 aa 外 , 其 他 9 个 APD 和 蛋 晶 的 信号 肽 序列 
长 16 ~18 aa, 日 氨基 酸 顺 序 非常 相似 , 因此 这 9 个 
表皮 和 蛋白 可 能 会 经 由 相似 的 转运 机 制 被 运输 到 昆虫 
体 辟 上皮 细胞 之 外 而 参与 外 骨骼 构建 。 切 除 信号 上 肽 
后 的 成 熟 APD 和 蛋白 分 子 量 在 6.0 ~37.0 kD 之 间 ， 
其 中 东方 蜜蜂 APD-2 与 西 蜂 APD-like、APD1 -3 的 
分 子 量 较 小 (6.0 ~12.0 kD), RRAS KE JP 
Wi7K e AERE 5296-6790, tig BEWuKTE. VH 


k APD-I-like 和 APD-3-like 的 成 熟 重 白 分 子 量 分 别 
为 18.0 kD 4122.4 kD), 与 丽 蝇 晴 集 金 小 蜂 的 APD 
1 ~3 的 大 小 接近 (分 别 为 23.1, 33.7 和 21.6 kD), 
这 5 个 分 子 量 相对 较 大 的 APD E A HP ZK TE ei 3E 
酸 残 基 含 量 相对 较 低 (36% - 4196) 。APD 和 日 的 等 
电 点 差异 较 大 , 其 中 西 蜂 的 APD 1-3, APD-1-like 及 
东方 蜜蜂 的 APD-2 为 弱 碱 性 蛋 日 , 其 pl 值 在 8.3 ~ 
10.8 之 间 , 而 其 他 5 个 APD EAK pl 值 在 6.2 ~ 
7.1 之 间 。 由 于 不 同 APD EASE ea RIUBRLZK PEE 
在 差异 , 因此 在 昆虫 表皮 内 的 特定 pH 环境 下 ,这 
些 APD 蛋白 会 以 不 同 的 静电 引力 和 玲 水 作用 力 与 
其 他 表皮 蛋白 或 几 丁 质 分 子 发 生 作用 。 
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表 2 Apidermin 家 族 成 员 的 生化 特性 


Table 2 Biochemical properties of apidermin family members 


JCATREAPIÓE 成 熟 蛋 日 pl 成 熟 蛋 日 长 度 (aa) 信号 肽 长 度 (aa) BK SAOERES E (70) 


EARM GenBank 登录 号 
Source of CenBank Mw of mature 
protein accession no. protein 
APD-1 Apis mellifera NP. 001078814. 1 9 260.67 
APD-2 A. mellifera NP. 001078815 6 110.38 
APD-2 A. cerana AER08513. 1 6 043.25 
APD-3 A. mellifera NP_001078813 9 021.51 
APD-like A. mellifera NP_001167615 11 951.75 
APD-1-like A. mellifera XP_001122844 18 052.96 
APD-3-like A. mellifera NP_001167616 22 426.60 
APD-1 Nasonia vitripennis | NP. 001166862 23 060. 23 
APD-2 N. vitripennis XP. 001605834 36 991.24 
APD-3 N. vitripennis XP. 001606544 21 569.46 


pl of mature Length of mature 


Length of signal Percent of hydrophobic 


protein protein peptide amino acids 
9.27 106 16 59.02 
10.27 61 16 66.23 
10. 83 60 16 67.11 
8.82 101 16 52.14 
7.14 134 18 54.61 
8.30 193 16 41.15 
6.17 258 17 40. 00 
6.97 247 16 41. 06 
6. 82 370 22 37.76 
6.51 246 17 35.74 


2.6 APD 蛋白 序列 的 多 序列 联 配 和 系统 进化 树 
分 析 

对 10 条 APD 和 蛋白 序列 的 联 配 分 析 显 示 ( 图 
5), APD EAJ] N 端 有 一 段 长 35 aa 的 保守 区 : 
| GA |-| PVAL |-x (2)-| GA ]-| PA |-| AS |-x (3)- 
| GVA |-[ GP |-x (6)-| PA |-x (2)-| GA ]-| PSG |- 
LAST ]-x(3) -[ GA ]-[ PSV]-x(2)-L GA ] , Æ C mA 
一 段 长 18 aa 的 保守 性 较 高 的 区 域 , 但 APD 家 族 没 
有 明确 的 基 序 和 结构 域 。 在 根据 Neighbor Joining 
法 构建 的 APD 和 蛋 日 系统 发 育 树 中 (图 6), 10 个 
APD 和 量 日 被 分 为 2 组 ,其 中 西 蜂 APD 1 -3 和 东方 
蜜蜂 APD-2 等 4 个 分 子 量 较 小 的 和 蛋 日 构成 系统 发 
育 树 的 一 个 分 支 ,而 丽 蝇 晴 集 金 小 蜂 APD 1 -3 & 
ELRIPQ ERU 3 个 APD 和 蛋白 构成 发 育 树 的 为 一 
个 分 文 。 系 统 进 化 分 析 结 果 上 暗示 APD 和 蛋 日 基因 的 
祖先 基因 在 蜜蜂 和 丽 蝇 肾 集 金 小 蜂 发 生物 种 分 化 之 
前 就 已 存在 。 

根据 系统 进化 树 分 析 结 有 果 ， 本 人 研究 将 APD E 
日 家 族 划 分 为 2 个 亚 家 族 。 图 7 为 这 2 个 亚 家 族 成 
员 和 蛋 日 序列 的 联 配 分 析 结 果 。 由 图 7(A) 可 见 ,， 亚 
家 族 工 的 4 条 小 分 子 量 APD 有恒 日 序列 具有 长 33 aa 
的 基 序 : [A]-LLA ]-[ AV ]2-x-[ P ] x-[ A ]-x (3)- 
L AV ]-LLV |-| AV ] -x-| P ] x-| VA |-x (3)- [ILV] - 
LAV ]-LLA ]-x-[ P ]-x (3) -LP ]-L LVA ]$-L LV | ; 而 
APD ERX IE B5 6 7 X538 EAE AM 2 个 保守 区 
A, HREL N 端的 基 序 长 50 aa， 其 保守 序列 为 : 
LG]-x(5)-L G]-LP ]-x (2)-[ 6 ]-x (6) -L P ]-x C2)- 
LG]-x(5)- [6]-x(3)- [G] -x(3)-[V]-x-[G] -x 


(3)-[6]-x(9)-[G], C 端 基 序 长 16 aa, 其 保守 序 
列 为 : [Cjx(5)-[LAV -LVL -L1I]-x-[G]-[P] - 
LS]- LG] T] 
2.7 WHER APD 蛋白 的 生物 信息 学 鉴定 

在 比较 蜜蜂 adp 基因 的 外 显 子 / 内 含 子 结构 (图 
4) 和 已 知 的 10 条 昆虫 APD 和 蛋白 序列 (图 5) 时 ,我 
们 发 现 东 方 塞 蜂 和 西 蜂 的 adp-2 在 基因 结构 和 产物 
重 晶 序列 上 都 非常 相似 , 说 明 adp-2 基因 在 东方 蜜 
蜂 和 西 蜂 发 生物 种 分 化 之 前 已 经 存在 , 同时 也 暗示 
其 他 蜂 类 昆虫 也 可 能 拥有 adp 基因 家 族 。 因 此 , R 
们 用 西 蜂 adp 基因 的 cDNA. 序列 查询 了 小 蜜蜂 Apis 
florea、 欧 洲 能 蜂 Bombus terrestris、 美 洲 能 蜂 Bombus 
impatiens ( http ://hymenopteragenome. org/beebase/ ; 
Munoz-Torres et al., 2011) 和 东方 蜜蜂 的 全 基因 组 序 
列 , 结果 发 现 6 个 西 蜂 adp 基因 在 东方 蜜蜂 和 小 蜜 
蜂 中 都 高 度 保守 ; 而 熊 蜂 基 因 组 序列 中 存在 apd-3- 
like 和 apd-1 的 对 应 基因 (BLASTN 分 值 分 别 为 396 
和 119) 。 为 了 探索 其 他 昆虫 是 否 也 存在 adp 基因 ， 
本 人 研究 用 已 知 的 10 条 APD AFIA y NCBI 
"ERE. 所 得 BLASTP 结果 见 表 3。 表 3 中 的 
12 个 蚂蚁 APD Z& FOE B TCR] 4AE: VUES 
Acromyrmex echinatior., f 27 8B iA 5 $13 B. Camponotus 
floridanus, EJ BEBE Harpegnathos saltator FUZI K "y 
Solenopsis invicta, 每 个 属 各 有 3 个 APD EHAA. 
从 基因 座 编 号 上 可 以 看 出 , WERN SERSA 
蚁 和 印度 跳 蚁 的 adp 基因 在 基因 组 序列 中 都 以 基因 
复 的 形式 和 存在， 而 红火 蚊 的 3 个 APD EA 3E DSL RE 
分 散在 基因 组 的 不 同 区 域 .美洲 能 蜂 的 3 个 APD 
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APD-2[A4pis cerana] | | ---- qINELLILFAIVAYYAAEB-------------------------------------------------------------------------.---.----.-.---------- 


ARD2lApismellijera] == 







APD-lApismelera] -~ EE ABIT N 
APD-3[Apis mellifera] er HB MI 
RISE Se I O22 —Ü u Il» Q1 41 OO E ONSE RUCIBSRNUN M ROS ILSORNEA I REUENGUDRUR REA N CHN NESEREAR UM EGER CMS NEN ON NEAN UH RII RO MOM Md 

APD-1-like[Apis mellifera] ^^^ H EHF FH E Lp EH ud iiL gia E sd 0 a ARENIS E Li A 

APD-1[Nasonia vitripennis] -----"fğrr 1ra rga agai - UN BülbvaLABBvvE 
APD-3[Nasonia vitripennis] - - -~ WBlkrivraravafsuBraBo-Bi---BEBBEER-REBGR- -- -BBaBLBBELAABAERAIB: ROGO RRLGRRRLB- ----aBiasposbapaavdrvBaR vind 
APD-3-like[Apis mellifera] ----- manyara vagaia a Beata La aav av aaa e aa BA BR RR MR BB BRA LB --- -apaa a 


APD-2[Nasonia vitripennis) wlzWz vB fra BB va B o B Ro B o vr vo B eB 8 c ER Do 8 Bo v c Bo v RR c v RR v RR D v ROG 


acce o am o um E EEG — 1 000—007 
APDOp4pismelferi — MM -— eap pop ala nca 4 ——————————————————————————————— 
APD-1[Apis mellifera) — Mri vba bebo a bab E — -++--++ +++ +++ + 
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APD-like[Apis mellifera] 
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i 
APD-1[Nasonia vitripennis] SLBA 
APD-3[Nasonia vitripennis) BB: BB BERI enaena v ERR RD ERR ERR v Bo o E DR v ERR E D v ER Do v ERR ER vo ro BEE- - ------------------- 
APD-3-like[Apis mellifera] VAR: Bo BERI enoa ERR e ERR o 8s vB Ro e e o o RR v RR o v ERR v Ev ra BD --------------------------- 
APD-2[Nasonia vitripennis] ^fi vigiar vega d: velo Eo d ve Ro d veo 5o c ve o c vB o c ERR RR cv ERR RR o o o Do o Do o RR RR RR 
APD-2[4pis cerana] ----- 
I A 
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APD-1-tike[Apis mellifera] 7777777777 M e FIBER cu B ca BD B E —————— 
ARDA vilkiptamis] 770mm nennen nemen meme mmu gu cam n 
APPS ne mt ii 
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APD-2[A4pis cerana] — .................---- 


APD-2[Nasonia vitripennis) ABBA WISI: NR S B ERR EO Do o v B o o B E E BI v I BE — ——-——-—-————- i 
A] 









APD-2[Apis mellifera] K —À aafavvaaf- cB 

APD-1[Apis mellifera] vella Baa vvaB B Ba 

APD: 3f4pis mellifera] HA m E ATEN um 
APD-like[4pis mellifera] — -- -Bl|aall------------ ABB Bv B- Bri 
APD-1-like[Apis mellifera) -- -BBEBBE------------ S 
APD-1[Nasonia vitripennis] Avg ajia Ba - - - - - - - ----- 88d Bo v ro SERERE RH A BR aa vH 
APD-3[Nasonia vitripennis] - - - BBBB1B- - - - - ------- I Av. 
APD-3-like[Apis mellifera] - --BAABYB------------ ABLBBHE- 1188 


BARES 
APD-2[Nasonia vitripennis] BvüSBBRBREEvRvEB. BRE a uL BGB: avr RSHRGRIBRGGERAR-Hra BARRERA TA RERO v RR RERRRRRRRE 
图 5 昆虫 apidermin 表皮 有 蛋白 氨基 酸 序列 联 配 结果 
Fig. 5 Alignment of amino acid sequences of insect apidermins 


N 末端 的 信号 肽 序列 和 多 肽 序列 保守 区 用 方 框 标 志 。The N-terminal signal peptide and the conserved region are indicated with a box. 
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图 6 基于 氨基 酸 序 列 的 昆虫 apidermin 表皮 和 蛋白 系统 发 育 树 
Fig. 6 Phylogenetic tree of of insect apidermins based on their amino acid sequences 
系统 发 育 树 用 MEGA 4.0 软件 根据 Neighbour-Joining 法 构建 , 枝 长 代表 分 歧 度 , 校 上 的 数字 为 自 举 值 1 000 次 的 支持 率 。 较 短 的 4 条 APD E 
白 序 列 被 划分 为 组 [ , 男 外 6 条 较 长 的 APD 和 蛋白 序列 被 划分 为 组 。The tree is generated with MEGA 4. 0 software using Neighbour-Joining 


method. The tree is drawn with branch length corresponding to partitions and branch numbers representing as percentage of bootstrap values in 1 000 


sampling replicates. Four shorter APD sequences are classified into group | , and the other six relatively longer APD sequences are classified into group 


II. 
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图 7 昆虫 apidermin 蛋白 家 族 的 2 个 亚 家 族 成 员 和 蛋白 氨 基 酸 序列 联 配 结果 
Fig. 7 Alignment of amino acid sequences of two apidermin subfamilies 
A; 蜜蜂 APD 1 -3 的 氨基 酸 序 列 联 配 Alignment of amino acid sequences of APD 1 -3 from honeybees. B: MIRIM E/ME APD 1 -3 与 西方 蜜蜂 
APD-like, APD-1-like 和 APD-3-like 的 氨基 酸 序 列 联 配 Alignment of amino acid sequences of APD 1 —3 from Nasonia vitripennis and APD-like, APD- 


1-like and APD-3-like from Apis mellifera. N 末端 的 信号 肽 序列 和 多 肽 序列 保守 区 用 方 框 标志 


， 信 号 肽 序列 中 的 红色 竖 线 表示 第 一 个 内 含 子 在 


基因 组 序列 中 的 位 置 。The N-terminal signal peptide and the conserved region are indicated with a box. The red bars in the signal peptide sequences 


indicate the position of the first intron in the genomic sequence. 


蛋白 基因 座 分 别 编 号 为 LOCI00749732, 
LOC100747739 和 LOC100645440 , 表明 前 2 个 基因 
座 在 基因 组 序列 上 较为 邻近 ; 而 欧洲 熊 蜂 的 2 个 
APD 蛋白 基因 座 (LOC100651155 和 LOC100645188 ) 
则 相距 甚 远 。 由 于 上 述 基因 组 序列 近期 才 被 测序 ， 
所 以 不 能 排除 这 些 基因 组 序列 存在 拼装 错误 。 本 研 
究 仅 在 蜜蜂 、 蚂 蚁 、 熊 蜂 和 丽 蝇 肾 集 金 小 蜂 等 昆虫 
的 基因 组 序列 中 鉴定 到 APD EH, 因此 APD 可 能 
是 膜 翅 目 昆虫 所 特有 的 一 类 表皮 蛋 日 。 


3 讨论 


Apidermin 表皮 和 蛋白 家 族 是 Willis(2010 ) 根据 3 
个 西峰 表皮 和 蛋白 apidermin 1 -3 (Kucharski et al., 
2007) 和 3 个 丽 蝇 师 集 金 小 蜂 apidermin 1 -3 而 划 
分 的 一 个 新 的 昆虫 表皮 有 蛋 日 家 族 。 孙 亮 先 等 
(2011) 根据 简单 基因 家 族 常 串联 排列 在 基因 组 序 
列 上 的 特点 在 西 蜂 apd 1 -3 基因 艇 上 游 发 现 了 
apd-like 基因 (图 2: A)。 在 此 基础 上 , 本 研究 结合 
生物 信息 学 分 析 和 RT-PCR 验证 ， 又 鉴定 了 西 蜂 
apd-1-like 和 apd-3-like( K] 1: A, B; 图 2:A), 并 对 


6 个 西 蜂 apd 家 族 成 员 的 基因 结构 、mRNA 转录 水 
平 及 产物 和 蛋 日 序列 特征 进行 了 全 面 比较 。 分 析 结 果 
显示 , 西 蜂 的 6 个 apd 基因 串联 排列 在 第 4 号 染色 
体 的 一 段 长 35.9 kb 的 序列 内 , 构成 一 个 简单 基因 
家 族 。5'LongSAGE 数据 显示 , 这 6 个 基因 在 成 年 
意 蜂 雄 蜂 头 部 中 的 转录 水 平 为 apd-3-like: apd-like: 
apd-2: apd-1 -like: apd-3: apd-1 21 044: 429: 416: 10: 
1:0( 图 2: B ~G)。 在 用 5'LongSAGE 分 析 意 蜂 雄 蜂 
头 部 表达 谱 时 , 我 们 发 现 3 655 个 有 功能 注释 基因 
的 平均 表达 丰 度 为 4.5 个 标签 拷贝 ,其 中 表皮 有 重 日 
Chitin_bind_4 基因 (GB16211, 480 个 标签 拷贝 ) 和 
apd-2 (GB10737 , 417 个 标签 拷贝 ) 是 转录 丰 度 最 高 
的 2 个 已 知 基 因 (Zheng et al., 2011) 。 但 由 于 当时 
apd-1-like 和 apd-3-like 所 在 的 基因 座 尚 属 预测 基 
因 , 所 以 我 们 并 未 进行 分 析 。 本 研究 发 现 apd-3-like 
是 雄 蜂 头 部 中 转录 水 平水 平 最 高 的 基因 , 其 丰 度 是 
apd-2 的 2.5 倍 ; 而 apd-1-like 的 表达 水 平 与 apd-2 
相似 。 转 录 水 平分 析 结 有 果 说 明 , 不 同 apd 基因 的 产 
物 重 日 在 雄 蜂 头 部 外 骨骼 中 的 含量 不 同 , 其 中 
APD-3-like, APD-like 和 APD-2 可 能 是 蜜蜂 头 部 外 
骨骼 的 主要 重 日 组 分 。 
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表 3 西 蜂 apidermin 和 蛋白 的 BLASTP 查询 结果 
Table 3 BLASTP results of apidermins from Apis millifera 


查询 的 蛋 日 Query protein BLASTP 查询 到 的 蛋白 Subject protein in BLASTP search 
一 SA BREM (w) 
AH 登录 号 登录 号 EG 预测 的 基因 座 
Score Query coverage 
Protein GenBank accession no. GenBank accession no. Insect Predicted gene cluster 
XP 003394948.1 Bombus terrestris LOC100645440 189 100 
XP 003493263.1 B. impatiens LOC100747739 160 100 
EFZ12167.1 Solenopsis invicta SINV 08838 162 100 
APD-like NP 001167615 

EFN66202. 1 Camponotus floridanus EAG 13893 144 96 
EGI60900. 1 Acromyrmex echinatior GSI 10818 137 100 
EFNT77443. 1 Harpegnathos saltator EAI 17469 186 100 

XP 001606610. 1 Nasonia vitripennis LOC100122215 105 90 
XP_003395235. 1 B. terrestris LOC100651155 271 100 

XP_003493279. 1 B. impatiens LOC100749732 249 81 

APD-1-like XP 001122844 EGI60899. 1 A. echinatior GSI 10817 157 80 
EFN77443. 1 H. saltator EAI 17469 203 98 

EFN66203. 1 C. floridanus EAG. 13894 134 76 

EFZ12153. 1 S. invicta SINV 05145 119 96 
XP 003394946. 1 B. terrestris LOC100645188 280 100 

EGI60898. 1 A. echinatior GSI 10816 209 98 
APD-3-like NP 001167616 EFZ12179. 1 S. invicta SINV 16177 196 100 
EFN66204. 1 C. floridanus EAG 13895 182 72 

EFN77442. 1 H. saltator 上 AI 17468 150 35 


不 同 西 蜂 apd 基因 的 启动 子 区 所 含 转录 因子 结 
合 位 点 存在 明显 的 差异 (图 3) , 意味 着 它们 的 表达 
调控 方式 可 能 有 所 不 同 。 在 Kucharski 等 (2007 ) 的 
研究 报道 中 ,adp-l 仪 在 晚 肾 斯 和 成 蜂 早期 的 外 肯 
Hi HE rpAEXA, adp-2 在 胚胎 和 成 蜂 的 气管 、 食 道 
和 胃 中 表达 ,adp-3 在 胚胎 、 肾 期 腹部 和 成 蜂 的 复 
眼 外 元、 和 气管、 食道 中 表达 。 有 趣 的 是 ，Kucharski 
等 (2007 ) 的 Northern 结果 表明 adp-1 会 在 工蜂 脑 组 
织 中 微弱 表达 。 在 发 现 了 这 一 现象 之 后 , 我 们 用 西 
蜂 的 6 个 adp 基因 的 cDNA 序列 查询 了 中 脑 组 织 
EST 数据 库 ( 孙 亮 先 和 郑 华军 , 未 发 表 数 据 )， 结 
却 在 469 162 条 ESTs 中 发 现 了 4 条 adp-2 的 ESTs 
序列 。 在 拼装 出 中 蜂 adp-2 基因 的 全 长 cDNA 序列 
( GenBank 登录 号 : JN627497 ) 后 , 我 们 用 RT-PCR 
验证 了 拼装 结果 (图 1: C)。 用 此 全 长 cDNA 序列 
查询 中 蜂 全 基因 组 序列 (东方 蜜蜂 基因 组 测序 项 目 
组 , 未 发 表 数 据 ) ， 结 果 得 到 了 该 基因 的 全 长 基因 
组 DNA 序列 (GenBank 登录 号 : JN627498) 。 目 前 
尚 不 清楚 adp 基因 在 蜜蜂 脑 组 织 中 表达 的 生物 学 意 


X, 或 许 外 骨骼 会 回 颅 腔 内 延伸 形成 突起 以 固定 和 
文 持 脑 组 织 , 而 APD 和 集 日 为 此 类 支持 物 的 组 分 。 
Kucharski 等 (2007 ) 报 道 西 蜂 APD 1 -3 和 蛋白 序 
列 都 含有 保守 四 肽 序列 AAPAAV， 而 APD-1 和 
APD-2 还 具有 一 个 富 含 精 氮 酸 基 序 RERR, Willis 
(2010) 将 apidermin 划分 为 昆虫 表皮 有 蛋 日 家 族 之 
一 , 但 未 阐述 该 家 族 的 序列 特征 。 本 人 研究 对 10 条 
来 自 于 西峰、 东方 蜜蜂 和 丽 蝇 肾 集 金 小 蜂 的 APD 
序列 进行 了 联 配 分 析 , 结果 发 现 APD Z& FIL RAR 2 
个 保守 区 域 ( 图 5), 但 缺乏 明确 的 基 序 或 结构 域 。 
然而 按 系 统 进化 树 分 析 结 果 将 APD 家 族 划分 为 2 
个 亚 家 族 ( 图 6), 则 亚 家 族 有 其 明确 基 序 (图 7)。 
据 上 讨论 , 我 们 提出 如 下 推测 : (1) 膜 翅 目 昆 
虫 发 生物 种 分 化 之 前 , 其 基因 组 序列 中 有 一 个 较 大 
的 apd 祖先 基因 ; 依据 是 蚂蚁 、 丽 蝇 肾 集 金 小 蜂 、 
熊 蜂 、 小 蜜蜂 、 东 方 蜜蜂 的 基因 组 中 都 含有 一 个 与 
西 蜂 apd-3-like 对 应 的 基因 ， 而 其 他 apd 基因 的 保 
守 性 较 低 ; (2) 物 种 分 化 后 , apd 的 祖先 基因 在 不 同 
基因 组 中 通过 基因 重复 形成 基因 簇 , 在 此 过 程 中 新 
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成 员 基 因 的 结构 发 生 较 大 变化 ( 如 第 一 个 内 含 子 发 
ERTER), 同时 有 些 碱 其 发 生 突变 , 结果 导致 
产物 蛋 日 序列 发 生 较 大 变化 ; (3) 蜜蜂 的 apd 基因 
家 族 在 西方 蜜蜂 、 东 方 蜜蜂 、 小 蜜蜂 发 生物 种 分 化 
前 已 形成 ; (4) 在 进化 时 间 上 , I% apd 1 -3 和 
apd-like 比 apd-3-like 晚 形 成 。 
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